DHAuDS: Benchmark dinámico y heterogéneo para adaptación en pruebas
DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.
DHAuDS es un benchmark de audio dinámico y heterogéneo que expone las debilidades reales de los modelos TTA frente a ruido realista. Ideal para investigadores.
Clasificación de audio con clases variables y pocos ejemplos usando adaptación de prototipos y entrenamiento pseudo-variable. ¡Alta precisión!
Descubre cómo la representación de datos afecta la robustez en clasificación de audio con suavizado aleatorio. Claves para elegir la representación correcta.
El probing con tokens de parche reactivados supera al costoso fine-tuning en clasificación de audio multi-etiqueta. Descubre este nuevo método ligero y eficiente.
Descubre cómo los modelos de difusión superan a métodos previos en clasificación zero-shot de sonidos ambientales, mejorando la generalización a clases no vistas.